互助问答第27期:面板数据的stata设置问题
问题1:我的论文主题是FTA对东道国吸引外资的影响研究(FDI用的是两国之间的流量),因此,我的数据是三维的,也就是年份+东道国+母国(详细数据见图片---回归数据)。现在我想使用双固定效应模型(同时固定时间和个体),于是我就将(东道国+母国)进行编码,把其看成一个个国家组合,并且引入新的标量id,同时对其赋值(1、2、3.、、)。问题:在我进行回归时,使用xtset id year时出现乱码,请问老师该怎么解决呢?
答案1: 该错误提醒你,在设置面板过程中年份和个体并不是一一对应的,存在着个体对于多个年份的现象,即某年之内存在着个体重复的现象,这一问题的出现于你的设置个体方式有直接关系,你把(东道国+母国)最为整体来设置个体,将忽略两国的先后顺序,那么其中某一年内可能对应着多个个体,从而使得面板设置出现错误。修改方式两种:第一,建议将东道国与母国分开进行设置个体id1、id2,然后将两者字符相加新的id,将与年份一一对应,重新设置;第二,不需要设置面板,不要使用xtset命令,而选择reghdfe命令, reghdfe y x,absorb(个体 年份) vce(cluster 个体),建议作者对reghdfe进行了解。当然,作者也可以使用duplicates drop id year, force将重复的个体予以删除,然后再进行设置就可以了。
答案2: 门限回归与断点回归的重要区别在于两种计量思想的差异。对于门限回归,其主要考虑到变量x对y的影响存在着非线性关系,以往的ols只是考虑到x对y的平均作用,而忽略了影响的异质性,基于此,门限回归更多地研究x在不同阶段对y作用的大小,同时门限回归还可考虑到x对y的影响是否还受到第三变量z的作用,是否随着z的变化x对y的作用也将发生改变,这些都是ols中所不能体现出来的。对于断点回归,该方法的提出更多地是针对因果推断的净效应,选择合适的分类变量来对样本进行分类,例如考察上大学是否会影响工资收入。对于这一命题的检验有很多方法,但断点的思路是比较500分(假如高考分数线为500分,以下是不能上大学的)左右人群的工资收入水平来说明上大学的影响,之所以选择500分左右的原因在于,断点假设在500分左右的人群在智商、能力等方面非常相似(有必要的检验)、不存在差异,故而工资差距完全来自于上大学,这便是断点回归的思想。以上的介绍就是这两种计量方法在思想出发点的不同,除此之外,具体操作检验等也都存在着差异,对于不再展开。
学术指导:张晓峒老师
本期解答人:Jie Xie 小大帝
编辑:小大帝
统筹:芋头 易仰楠
技术:知我者
往期回顾
关于我们
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“论文导向计量实证社区”。任何侵权行为将面临追责!)